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秒 脉 冲 星 对 引力 波 探 测 、 太 空 导航 等 方面 具有 重要 意义 。 本 文通 过 引证 ATNF 


ig 


SR, TRUER SMT REFER AR. aS FAST 早期 科学 数据 中 心 脉冲 


双星 搜索 能 力 的 现状 目前 Ransom 版 本 的 accelsearch 算法 虽 在 CPU 上 进行 了 高 度 优化 


但 在 FAST 庞大 数据 量 下 ， 仍 十 分 耗费 算 力 。 罗 晋 涛 GPU 版 本 的 加 速度 搜索 带 来 6-8 倍 的 


加 速效 果 ， 但 未 能 针对 GPU 内 存 进行 有 效 优 化 。 本 文 先 概述 脉冲 双星 及 其 轨道 运动 对 信和 号 
处 理 带 来 的 影响 ， 然 后 引出 相应 的 搜索 技术 及 原理 ， 为 提高 脉冲 双星 的 搜索 效率 ， 利 用 并 行 
化 技术 编写 程序 对 GPU 版 本 的 加 速度 搜索 进行 优化 。 结 果 表 明 ， 使 用 不 同 zmax 参数 对 不 


同 .dat 文件 进行 处 理 ， 速 度 均 有 明显 提升 。 
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脉冲 双星 系统 的 发 现 极 具 科学 意义 。1974 年 ， 赫 尔 斯 和 泰勒 在 天 鹰 座 天 域 探 测 到 脉冲 


信号 ， 经 计算 发 现 是 一 颗 脉 冲 双 星 中 (PSR B1913+16) 的 信号 。 两 人 通过 深入 研究 首次 发 


现 引 力 波 存在 的 间接 定量 证 据 名 ,并 因此 获得 1993 年 诺 贝 尔 物理 学 奖 。2020 年 2 月 , 王 琳 


基于 FAST 数据 在 M13 中 发 现 一 颗 处 于 双星 系统 中 的 毫秒 脉冲 星 M13F， 并 认证 该 星团 


中 另 一 脉冲 星 M13E 为 掩 食 双 星 ， 首 次 测量 出 M13 中 4 个 脉冲 双星 系统 的 轨道 椭 率 ， 同 时 


获得 M13 现 有 脉冲 星 的 国际 最 好 计时 结果 中 。 这 些 成 果 都 在 推动 着 科学 的 进步 。 


遗憾 的 是 ， 现 有 脉冲 双星 的 搜索 较为 耗 时 ， 搜 索 能 力量 竺 提升 。 一 方面 是 FAST 早期 


科学 数据 中 心 对 数据 存储 和 处 理 能 力 的 要 求 。 在 FAST 开启 19 波束 巡天 漂移 扫描 后 ， 数 据 


量 激增 ， 每 天 产生 压缩 数据 50TB， 每 年 〈 按 200 天 计算 ) 将 产生 10PB 超级 数据 ， 如 何 利 
j 好 这 批 数据 ， 是 对 数据 中 心 的 存储 和 超 算 能 力 的 严峻 考验 。 另 一 方面 ， 高 效 的 搜索 能 力 对 
FAST 探测 优质 的 毫秒 级 脉冲 星 具 有 重要 意义 。 在 FAST 早期 科学 数据 中 心 " 脉 冲 星 分 布 式 


搜索 计算 系统 Craber 包 中 使 用 加 速度 搜索 (accelsearch ) 方法 571， 当 参数 zmax 设置 较 大 


时 《一 般 为 200 UE) ， 搜 索 效率 显著 降低 。 目 前 ，Ransom 版 本 的 accelsearch 方法 四 


虽然 在 CPU 上 进行 了 高 度 优 化 ， 但 速度 仍 有 所 欠缺 。 单 机 八 核 处 理 一 个 大 小 约 140G 的 巡 


天 漂移 扫描 数据 ，zmax 参数 预 设 200， 耗 时 约 ~20h， 这 仅 是 10min 巡天 且 经 过 处 理 的 数 
S 据 量 。 显 然 ， 这 种 数据 处 理 能 力 极 大 限制 了 脉冲 双星 的 有 效 发 现 。 
© 此 外 ， 双 星系 统 中 蕴含 大 量 毫秒 级 脉冲 星 。 如 表 1 和 图 1 中 数据 ， 球 状 星团 中 包含 大 


ce 量 脉冲 双星 ， 且 多 为 毫秒 级 脉冲 星 。 截 止 2020 年 底 ，ATNF 脉冲 星 数据 库 共 收录 脉冲 双星 


149 Hie. APAIA 130 颗 在 球状 星团 中 发 现 ， 表 1 中 给 出 部 分 球状 星团 中 样本 数据 统计 结 


果 ， 图 1 统计 了 148 颗 脉冲 星 的 周期 分 布 《 有 1 颗 周期 为 2.7s 统计 意义 不 大 未 记 入 ) 。 


表 1 截止 2020 年 12 月 部 分 球状 星团 的 样本 数据 四 


Table 1 Sample data of part globular clusters till December 2020 


Galactic longitude Galactic latitude Distance Number of Number of binary 
Cluster Name 
(deg) (deg) (kpc) Pulsars pulsars 

47 Tuc (NGC 104) 305.90 -44.89 4.5 25 15 

M3 (NGC 5272) 42.41 78.71 10.4 >3 >2 

M5 (NGC 5904) 3.86 46.80 7.5 5 4 

M13 (NGC 6205) 59.01 40.91 7.7 5 3 

M62 (NGC 6266) 353.57 7.32 6.9 6 6 


© 2014 年 ， 国 家 天 文 台 与 贵州 师范 大 学 共同 建立 FAST 早期 科学 数据 中 心 
= http://www.atnf.csiro.au/people/pulsar/psrcat/ 
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Terzan 5 3.84 1.69 10.3 38 19 
NGC 6440 7.73 3.80 8.4 6 3 
NGC 6441 353.53 -5.01 11.7 4 2 
NGC 6544 5.84 -2.20 2.7 2 2 

M28 (NGC 6626) 7.80 -5.58 5.6 12 8 


在 距 太阳 系 一 15kpc 内 球状 星团 的 脉冲 星 中 ， 双 星 数量 占 比 较 大 。 其 中 ，47 Tuc 形状 球 团 已 发 现 的 脉冲 星 


中 ，60% 为 双星 。Terzan 5 经 认证 的 脉冲 星 中 有 一 半 为 脉冲 双星 。 


Among the pulsars of globular clusters within ~15kpc of the solar system, the number of binary 


pulsar is relatively large. Among the pulsars discovered in 47 Tuc, 60% are binary pulsar. And h 


alf of Terzan 5's certified pulsars are binaries. 


图 1 截止 2020 年 12 月 双星 系统 中 脉冲 星 周期 的 分 布 统计 


Figure 1 Distribution statistics of pulsar periods in binary system till December 2020 
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截止 2020 年 12 A, ATNF 数据 库 记 录 的 149 颗 双星 系统 脉冲 星 中 ， 有 113 颗 属 于 毫秒 级 脉冲 星 ， 占 双星 


系统 的 四 分 之 三 ， 约 75.8%。 其 中 ，2 一 4ms 约 占 毫秒 脉冲 星 总 数 的 六 成 。 


In 


There are 149 binary system pulsars recorded in the ATNF database till December 2020. About 


113 are millisecond pulsars, accounting for three-quarters of the binary system (75.896 approximat 


ely). It makes up 6096 where period is 2—4ms among millisecond pulsars. 


7,4 


103.0014 
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根据 图 1 的 统计 结果 来 看 ， 双 星系 统 中 毫秒 级 脉冲 星 数量 居多 。 在 文 [10] 中 首次 提出 毫 


秒 脉 冲 星 是 正常 脉冲 星 通过 在 低 质量 X 射线 双星 阶段 吸 积 物质 而 被 加 速 到 毫秒 量 级 。 同 期 


发 表 的 文 [11] 中 ，Alpar 也 认为 当 低 磁 场 的 中 子 星 吸 积 物质 加 速 到 毫秒 级 后 会 演化 为 双星 系 


统 。 刘 鹏 等 在 文 [12] 中 模拟 的 P 一 了 图 展示 了 双星 脉冲 星 群 自转 周期 峰值 在 Sms 左右 ， 并 将 


双星 脉冲 星 群 称 为 毫秒 脉冲 星 群 。 由 此 可 知 ， 双 星系 统 与 毫秒 脉冲 星 存在 密切 关系 。 但 数据 
中 心目 前 针对 双星 系统 的 搜索 较为 耗 时 ， 因 此 ， 脉 冲 双 星 搜 索 能 力 的 提升 十 分 必要 。 本 文 首 
先 介绍 脉冲 双星 系统 及 其 搜索 方法 ,然后 分 析 其 方法 并 根据 其 特点 在 程序 上 实现 了 并 行 化 ， 
数 倍 地 提高 了 脉冲 双星 系统 的 搜索 效率 。 


1、 脉 冲 双 星系 统 与 加 速度 搜索 


1.1 双星 系统 及 搜索 技术 


脉冲 双星 系统 是 相互 绕 行 的 两 颖 中 子 星 ， 其 中 一 颗 是 脉冲 星 ， 另 一 颗 称 为 伴星 咏 。 通 
常情 况 下 ， 当 星体 自转 且 磁 极 波束 扫 过 信号 探测 设备 时 ， 探 测 设备 就 能 够 接收 到 一 个 脉冲 信 
号 中 。 传 统 的 周期 搜索 中 ， 对 采样 信号 进行 快速 傅立叶 变换 将 时 域 信号 转换 到 频 域 ， 再 通 
过 计算 频谱 功率 来 寻找 周期 。 在 双星 系统 中 ,脉冲 星 受到 伴星 引力 作用 ,产生 具有 加 速度 的 
轨道 运动 ， 受 其 影响 ， 脉 冲 星相 对 信号 探测 设备 的 视 向 速度 将 发 生变 化 中 由 于 多 普 勒 效应 ， 
探测 设备 接收 到 的 星体 自 旋 频率 将 发 生变 化 中 ， 传 统 的 周期 搜索 方法 不 适用 ， 也 难以 检测 到 
该 脉冲 星 。 

加 速度 搜索 方法 "1 可 有 效 消除 这 种 影响 。 该 方法 采用 恒定 加 速度 来 近似 轨道 运动 的 加 
速度 ， 从 而 消除 观测 数据 中 由 于 双星 的 轨道 运动 导致 的 脉冲 到 达 时 间 的 变化 站。 在 恒定 加 


速度 的 假设 下 ， 脉 冲 星 的 自 旋 频 率 在 观察 者 参考 系 中 的 漂移 速率 f 与 加 速度 a 有 如 下 关系 : 


jue 


C 


(1) 


其 中 ，c 为 光速 ,fo 为 脉冲 星 在 自身 惯性 系 中 的 自 旋 频率 。 根 据 信号 处 理 角 度 的 不 同 ， 


可 分 为 时 域 加 速度 搜索 TDAS (Time Domain Acceleration Search) 和 频 域 加 速度 搜索 F 
DAS (Fourier Domain Acceleration Search) n9。 下 面 分 别 介绍 两 种 方法 。 


1.2 时 域 加 速度 搜索 


时 域 加 速度 搜索 通过 线性 展 宽 或 压缩 信号 的 方式 对 数据 进行 重新 采 梯 以 补偿 轨道 运动 
引起 的 多 普 勒 效应 ， 并 在 一 定 范围 内 不 断 尝试 加 速度 值 ， 来 找到 最 接近 真实 值 的 时 间 序 列 ， 
再 利用 周期 搜索 技术 寻找 周期 信号 。 进 行 重 采样 时 信号 的 时 间 间 隔 由 公式 描述 为 


r(t) = [14-2 = vli + S id 


C 


CH, v 为 视 向 速度 ，c 是 光速 。to 是 保证 正确 采样 的 常数 ， 可 由 公式 〈2) 计算 。 


N 


N 


"a xm tsamp 
0 — (3) 
14-2 


XP t samp E KEFR TAHIR, T 是 积分 时 间 ，a 是 尝试 的 加 速度 值 ，c 为 光速 。 


脉冲 星 搜索 软件 包 SIGPROCH74、PEASOUPe 等 应 用 了 该 技术 。 利 用 该 方法 ，Amico 


等 人 在 球状 星团 中 找到 了 四 个 毫秒 脉冲 星 5， 观 测 参数 见 表 2。 


K2 Amico 等 人 发 现 的 四 颗 毫 秒 脉冲 星 观测 参数 


Table 2 Observed parameters of four millisecond pulsars discovered by Amico et al. 


Pulsar PSR J1701-30 PSR J1740-53 PSR J1807-24 PSR J1910-59 
e Period(ms) 5.2415 3.6503 3.0594 3.2661 
= DM(cm-3pc) 114.4 71.8 134.0 34.0 
= Orbital period 3.805 1.354 0.071 0.865 
(days) 


1.3 频 域 加 速度 搜索 
频 域 加 速度 搜索 基于 相关 性 技术 中， 该 技术 可 提高 频谱 功率 。 前 文 讲 到 ， 受 轨道 运动 
影响 ， 接 收 到 的 脉冲 星 信 号 频率 将 发 生变 化 。 这 在 频谱 中 表现 为 某 一 频率 的 功率 扩散 至 周围 
相 邻 的 频率 点 中 。 这 导致 普通 的 周期 搜索 方法 失效 。 文 [19] 中 提 到 ， 可 将 原 信 号 与 邻近 的 信 
号 进行 相关 操作 ， 从 而 确定 相似 程度 以 恢复 信号 。 该 过 程 可 由 式 〈4) 表示 ， 
[ro]+m/2 


ro Š > Ak Ar Lk (4) 
k=[ro]—m/2 


其 中 ，ro 是 要 搜索 的 脉冲 星 的 信号 频率 点 (Fourier frequency bins， 可 理解 为 傅立叶 
域 中 的 频率 范围 ,我们 用 0，1，2，3… 来 代表 频谱 中 的 第 个 频率 点 ) 。A 是 对 应 第 ro 个 频 
率 点 的 傅立叶 响应 ， 其 值 可 由 邻近 的 m 个 频率 点 的 傅立叶 响应 来 相关 地 恢复 。At _xk 是 复 共 


PEK. 
通常 认为 ， 在 观测 时 间 远 小 于 轨道 周期 的 情况 下 使 用 该 方法 效果 更 好 。 即 满足 


s https://zenodo.org/record/10178 
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Port 


10 


Tobs < (5) 


L 


其 中 , Tobs 为 脉 六 


星 观测 时 间 ，Por 为 脉冲 星 轨道 运动 周期 。 当 观测 时 间 和 轨道 周期 满 


足 〈5) 时 ， 加 速度 可 视 为 常数 ， 结 合 多 普 勒 公式 有 : 


7 Pi zc 
do fol? 


(6) 


式 中 , c 是 光速 ,，T 为 脉冲 星 观 测 时 间 , f 为 谐 波 频 率 , z 为 假设 频率 漂移 的 频率 点 数量 。 


这 样 ， 根 据 漂移 的 频率 点 数 z， 通 过 局 部 信号 傅立叶 响应 的 互相 关 来 恢复 原始 信和 号 


其 他 周期 搜索 方法 也 可 处 理 该 影响 ,但 应 用 条 件 不 同 。 相 位 调制 搜索 主要 针对 观测 时 间 
与 双星 轨道 周期 大 致 相同 的 情况 ， 边 带 搜 索 在 观测 时 间 远 大 于 轨道 周期 时 效果 更 好 。 而 加 速 
度 搜索 的 使 用 条 件 决 定 了 该 方法 适用 目标 为 周期 更 小 的 毫秒 脉冲 星 在 实际 中 也 搜寻 到 许多 


优质 脉冲 星 。Ransom 首次 使 用 该 方法 在 球状 星团 NGC 6544 中 发 现 脉冲 星 PSR J1807- 


2459A08], Barr E.D. 利 用 该 技术 发 现 了 高 度 偏 心 的 宣 秒 脉冲 星 PSR J1946+3417， 其 偏心 


率 达 到 了 0.13-0.14， 这 极为 罕见 同时 也 预示 着 不 同 寻常 的 形成 过 程 。 
2、 频 域 加 速度 搜索 并 行 化 的 必要 性 及 可 行 性 分 析 


针对 频 域 加 速度 搜索 的 并 行 化 提速 十 分 必要 。 文 [15] 中 论述 了 轨道 运动 对 脉冲 到 达 时 间 


影响 很 小 ， 在 一 定 条 件 下 不 用 加 速度 搜索 也 可 发 现 双 星 。 但 2020 年 2 月 FAST 首 颗 双星 的 


发 现 中 , 王 琳 博士 等 将 zmax 参数 设置 为 300 才 搜 索 到 脉冲 星 PSR J1641+3627F[34 可 见 ， 


随 着 FAST 搜索 要 求 的 不 断 提升 ， 扩 大 加 速度 的 搜索 范围 是 必然 ， 否 则 FAST 数据 无 法 得 
到 有 效 吸收 ， 可 能 错失 优质 的 脉冲 星 。 
相 比 TDAS，FDAS 更 快 且 更 适合 并 行 化 。TDAS 要 将 处 理 过 的 时 间 序 列 全 部 加 载 到 内 


存 ， 而 FDAS 处 理 的 是 局 部 序列 的 卷 积 ， 更 适合 小 内 存 的 GPU 进行 并 行 化 处 理 。 对 尝试 的 


不 同 加 速度 值 进行 处 理 时 , TDAS 需要 对 每 个 加 速度 值 重 采 样 后 的 序列 进行 FFT 变换 ， 而 F 


DAS 只 需 做 一 次 FFT 变换 ， 再 进行 相关 操作 即 可 。 同 时 ，FDAS 可 看 作 是 一 个 滤波 过 程 ， 
本 质 是 原 信 号 与 滤波 器 的 卷 积 操作 。 原 信号 长 度 远 大 于 滤波 器 长 度 ， 计 算 的 时 间 复 杂 度 约 为 
O(N2), N 为 信号 长 度 。 为 提高 计算 效率 ， 本 文 使 用 快速 傅立叶 变换 做 循环 卷 积 ， 这 基于 分 
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治 的 思想 。 首 先 将 原 信号 拆 分 成 与 滤波 器 等 长 度 的 信号 (滤波 器 中 需要 补 0) ， 再 分 别 与 渡 
波 器 做 卷 积 并 做 傅立叶 逆 变 换 到 时 域 ， 最 后 将 结果 中 重合 的 部 分 截 去 ， 再 合并 为 输出 信号 ， 
这 一 过 程 也 称 重 且 保留 法 ， 可 由 图 2 描述 。 这 可 将 算法 的 时 间 复 杂 度 降 至 O(NIgN)。 综 上 所 


述 ， 在 该 过 程 中 使 用 循环 卷 积分 段 计算 所 具备 的 局 部 内 存 性 是 高 度 可 并 行 的 ， 非 常 适合 使 用 
做 并 行 化 计算 。 


图 2 FDAS 中 应 用 的 循环 卷 积 ? 


Figure 2 circular convolution in FDAS 


as pn 
HX 


输入 信 


如 图 ， 滤 波 器 hh 中间 补 一 定 长 度 的 0 元素， 五 为 其 傅立叶 变换 。 将 输入 信号 x 分 段 ， 每 段 长 为 M， 将 


每 段 信号 x; 向 前 多 取 N/2 个 点 ， 则 第 一 段 前 面 需 补 N/2 个 0， 再 对 每 段 信号 做 傅立叶 变换 得 到 XX，Xi 与 及 


在 复数 域 中 相 乘 再 进行 傅立叶 逆 变 换 得 到 4、B、C， 将 4、B、C 中 混 炙 的 部 分 截 去 ， 得 到 4'、B'、C' 拼 
接 起 来 即 为 等 价 的 线性 卷 积 。 


=> 


In the figure, the middle of the filter h needs to be filled with a certain length of 0, and H i 


s the Fourier transform. The input signal x is divided into segments, the length of each segment 


is M. Each segment of signal x; is forwarded by N/2 points, thus the first segment needs to be fi 


lled with N/2 0 points. Then every signal is transformed to X; in Fourier domain , X; and H are 


multiplied in the complex domain and then inverse Fourier transform is performed to obtain A, B 


and C, and the aliased part of A, B and C is cut off, and A', B' and C' are spliced together. Lin 


a https://blog.csdn.net/u010592995/article/details/77882183 
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ear convolution of valence. 


3、 频 域 加 速度 搜索 并 行 化 的 实现 


根据 第 二 部 分 的 介绍 ， 程 序 耗 时 的 矛盾 主要 在 于 大 量 可 并 行 的 卷 积 计算 。 罗 晋 涛 GPU 


版 本 的 加 速度 搜索 在 内 存 方面 尚 可 继续 优化 。 一 方面 ， 我 们 通过 循环 卷 积 来 局 部 地 缩短 时 间 
序列 的 长 度 从 而 降低 内 存 压 力 。 另 一 方面 ， 循 环 卷 积 中 分 段 后 的 序列 可 利用 GPU 计算 单元 
的 局 部 内 存 来 完成 运算 。 本 文 实现 的 程序 流程 图 见 图 3 (b) 。 

在 对 循环 分 段 的 时 间 序 列 进行 傅立叶 变换 时 ， 本 文 使 用 CUDA 库 封 装 好 的 cuFFT 接口 ， 
因为 该 接口 已 针对 NVIDIA GPU 进行 了 FFT 的 高 度 优化 。 利 用 批 处 理 cuFFT 例 程 ， 在 GPU 上 
并 行 调 用 一 次 即 完成 多 段 序列 的 傅立叶 变换 。 处 理 加 速度 滤波 器 时 ， 我 们 在 一 个 GPU Grid 
中 加 载 滤 波 器 ， 其 中 每 一 个 线程 中 都 加 载 全 部 滤波 器 ， 然 后 沿 分 段 处 理 并 经 过 傅立叶 变换 后 
的 信号 ， 分 别 与 不 同 的 分 段 频 域 信 号 进行 复数 域 的 乘法 运算 。 这 一 过 程 在 局 部 进行 ， 且 每 个 
线程 都 在 同步 处 理 相同 的 运算 。 再 将 运算 结果 写 回 到 全 局 内 存 中 进行 傅立叶 逆 变 换 和 重 受 段 
的 去 除 ， 进 行 合并 后 得 到 输出 。 


重合 N/2 
对 时 间 序 列 分 块 


FFT (复数 形式 ) 


FFT (复数 形式 ) 一 傅立叶 域 S 块 | 


^i 


L 与 滤波 器 卷 积 ， 即 是 传 


立 叶 域 的 复数 乘法 


S 个 信号 块 分 别 与 Z 个 
滤波 器 复数 相 乘 


傅立叶 域 逆 变 换 


除去 重 每 部 分 


(a) (b) 


R3. (a) 线性 卷 积 运算 流程 ; (b) 本 文中 循环 卷 积 处 理 流程 


Fig 3. (a) The flow chart of linear convolution; (b) The process of cyclic convolution in this 
article. 
ap ue 
4、 实 验 及 结果 


实验 使 用 AMD Ryzen7 2700X 8 核 16 线程 CPU， 两 张 GeForce GTX1080 显卡 ， 对 FA 


ST 漂移 扫描 数据 的 若干 文件 (PSR20180811 00A01H. PSR20180826 00A01H. PSR2018 


0828_00A01H、PSR20180902_00A01H， 观 测 参数 见 表 3) 消 色散 后 产生 的 .dat 文件 进行 测 


4 


试 ， 使 用 不 同 zmax 参数 对 该 批文 件 处 理 ， 产 生 相 应 标记 周期 信号 的 ACCEL 文本 文件 ， 


与 CPU 版 本 、 罗 晋 涛 GPU 版 本 的 加 速度 搜索 做 了 对 比 。 


表 3. 本 次 实验 使 用 的 观测 文件 参数 


Table 3. Observed parameters used in this experiment 


Parameter Value 
Telescope used FAST 
Instrument used MB4K 


58341.09509 (PSR20180811 00A01H) 
Epoch of observation (MJD) 

58356.06175 (PSR20180826 00A01H) 

58358.07425 (PSR20180828 00A01H) 


58363.02564 (PSR20180902 00A01H) 


Number of bins in the time series 70902784 
Width of each time series bin (sec) 4.9152e-05 
Central freq of low channel (MHz) 1124.93896484 
Total bandwidth (MHz) 250 

Number of channels 2048 


Channel bandwidth (MHz) 0.1220703125 
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一 


PSR20180811_00A01H 


(a) 


PSR20180828_00A01H 


(c) 


图 4. Ransom 版 本 、 罗 晋 涛 版 本 与 本 文 方法 使 用 不 同 zmax 参数 对 四 个 文 伯 


丸 行 时 间 /min 


ChinaXiv 合 作 期 刊 


PSR20180826_00A01H 


Cb) 


PSR20180902_00A01H 


(d) 


比 结果 。 其 中 ， 


(a)、(b)、(c)、(d) 依 次 对 应 四 个 文人 


F 的 执行 所 消耗 的 时 间 对 


F PSR20180811 00A01H. PSR20180826 00A01H. 


PSR20180828 00A01H. PSR20180902 00A01H. 


Fig4. Comparison of different methods in execution time. (a)PSR20180811_00A01H;(b)PSR20 


180826 00A01H; (c)PSR20180828 00A01H; (d)PSR20180902 00A01H. 


结果 表明 ， 采 用 文中 方法 对 加 速度 搜索 程序 改进 后 ， 本 文 并 行 化 处 到 


方法 耗 时 相 比 Ra 


nsom 版 本 有 极 大 提升 ， 加 速 比 约 10-12 fi, RO MAHA ERE, HITZ 1.5-1.7 


倍 。 综 合 来 看 ， 程 序 的 改进 有 一 定 成 效 ， 达 到 预期 效果 。 
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Binary Pulsar System Acceleration Search Method and Software 
Improvement 


Ji Changxu, Liu Zhijie; Yu Xuhong 


Key Laboratory of Information and Computing Science in Guizhou Province 


Abstract: Millisecond pulsars are of great significance to gravitational wave detectio 
n and space navigation. We point out that the binary star system is closely related 
to the millisecond pulsar by citing the ATNF database. We analyzed the search c 
apabilities of binary pulsar system in early scientific data center. Although the curre 
nt version of the accelsearch is highly optimized on CPU, it still consumes computi 
ng power under the huge amount of FAST data. Luo's GPU version of the acceler 
ation search brings 6-8 times speedup, but it fails to optimize the short signal and 
GPU memory effectively. We summarize the impact of orbital motion in binary puls 
ar system firstly, and then introduce the search technology. We write programs to 
optimize the GPU version of the acceleration search in order to improve the search 
efficiency. Our benchmark shows that using different zmax parameters to process 
different .dat files has significantly improved the speed. 
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